智能论文笔记

Multimodal SuperCon: Classifier for Drivers of Deforestation in Indonesia

Bella Septina Ika Hartanti , Valentino Vito , Aniati Murni Arymurthy , Andie Setiyoko

分类：计算机视觉 | 机器学习

2022-07-29

森林砍伐是导致气候变化的因素之一。气候变化对人类的生命有严重的影响，并且由于二氧化碳等温室气体的排放到大气中而发生。重要的是要了解缓解工作的森林砍伐原因，但是缺乏数据驱动的研究来预测这些森林砍伐驱动因素。在这项工作中，我们提出了一种称为多模式SuperCon的对比学习体系结构，用于使用从Landsat 8获得的卫星图像对印度尼西亚的森林砍伐进行分类。多模式SuperCon是一种结合了对比度学习和多模式融合以处理可用的Deforestation数据集的架构。我们提出的模型优于先前的驾驶员分类工作，与同一任务的最新旋转模型相比，准确性提高了7％。

translated by 谷歌翻译

An Asymmetric Contrastive Loss for Handling Imbalanced Datasets

Valentino Vito , Lim Yohanes Stefanus

分类：机器学习 | 计算机视觉 | (统计)机器学习

2022-07-14

对比学习是一种表示方法，该方法是通过将样品与其他类似样本进行对比，以使它们紧密地将其结合在一起，从而在特征空间中形成簇。学习过程通常是使用两阶段训练架构进行的，它利用对比度损失（CL）进行功能学习。对比度学习已被证明在处理不平衡数据集方面非常成功，其中某些课程的代表性过高，而另一些类的代表性不足。但是，以前的研究并未针对数据集进行不平衡的CL进行专门修改。在这项工作中，我们引入了一个不对称版本的Cl（称为ACL），以直接解决类不平衡问题。此外，我们提出了不对称的局灶性对比损失（AFCL）作为ACL和局灶性对比损失（FCL）的进一步概括。 FMNIST和ISIC 2018不平衡数据集的结果表明，AFCL能够以加权和未加权分类精度优于CL和FCL。在附录中，我们在熵上提供完整的公理处理以及完整的证明。

translated by 谷歌翻译

NusaCrowd: Open Source Initiative for Indonesian NLP Resources

Samuel Cahyawijaya , Holy Lovenia , Alham Fikri Aji , Genta Indra Winata , Bryan Wilie , Rahmad Mahendra , Christian Wibisono , Ade Romadhony , Karissa Vincentio , Fajri Koto

分类：自然语言处理 | 人工智能

2022-12-19

We present NusaCrowd, a collaborative initiative to collect and unite existing resources for Indonesian languages, including opening access to previously non-public resources. Through this initiative, we have has brought together 137 datasets and 117 standardized data loaders. The quality of the datasets has been assessed manually and automatically, and their effectiveness has been demonstrated in multiple experiments. NusaCrowd's data collection enables the creation of the first zero-shot benchmarks for natural language understanding and generation in Indonesian and its local languages. Furthermore, NusaCrowd brings the creation of the first multilingual automatic speech recognition benchmark in Indonesian and its local languages. Our work is intended to help advance natural language processing research in under-represented languages.

translated by 谷歌翻译

Regularized ERM on random subspaces

Andrea Della Vecchia , Jaouad Mourtada , Ernesto De Vito , Lorenzo Rosasco

分类： (统计)机器学习 | 机器学习

2022-12-04

We study a natural extension of classical empirical risk minimization, where the hypothesis space is a random subspace of a given space. In particular, we consider possibly data dependent subspaces spanned by a random subset of the data, recovering as a special case Nystrom approaches for kernel methods. Considering random subspaces naturally leads to computational savings, but the question is whether the corresponding learning accuracy is degraded. These statistical-computational tradeoffs have been recently explored for the least squares loss and self-concordant loss functions, such as the logistic loss. Here, we work to extend these results to convex Lipschitz loss functions, that might not be smooth, such as the hinge loss used in support vector machines. This unified analysis requires developing new proofs, that use different technical tools, such as sub-gaussian inputs, to achieve fast rates. Our main results show the existence of different settings, depending on how hard the learning problem is, for which computational efficiency can be improved with no loss in performance.

translated by 谷歌翻译

Social Assistive Robotics for Autistic Children

Stefania Brighenti , Federico Buratto , Fernando Vito Falcone , Cristina Gena , Claudio Mattutino , Matteo Nazzario

分类：机器人 | 人工智能

2022-09-25

本文介绍了针对自闭症儿童的社会辅助机器人技术，旨在使用机器人疗法进行自闭症。该项目的目的是测试自闭症儿童与社会机器人NAO的互动。特别是机器人将在其工作中支持操作员（心理学家，教育者，言语治疗师等）。该项目的创新方面是，儿童机器人互动将考虑孩子的情绪和特定特征，机器人将相应地适应其行为。

translated by 谷歌翻译

Controller Synthesis for Timeline-based Games

Renato Acampora , Luca Geatti , Nicola Gigante , Angelo Montanari , Valentino Picotti

分类：人工智能

2022-09-21

在最初出生在太空行业的基于时间轴的计划方法中，一组状态变量（时间表）的演变受一组时间约束的控制。基于传统时间表的计划系统在整合计划与处理时间不确定性的执行方面表现出色。为了处理一般的非确定主义，最近引入了基于时间轴的游戏的概念。已经证明，发现此类游戏是否存在获胜策略是2Exptime-Complete。但是，缺少合成实施此类策略的控制器的具体方法。本文填补了这一空白，概述了基于时间轴游戏的控制器合成方法。

translated by 谷歌翻译

Sparse Vicious Attacks on Graph Neural Networks

Giovanni Trappolini , Valentino Maiorca , Silvio Severino , Emanuele Rodolà , Fabrizio Silvestri , Gabriele Tolomei

分类：机器学习

2022-09-20

事实证明，图形神经网络（GNN）在图形结构数据的几个预测建模任务中已被证明。在这些任务中，链接预测是许多现实世界应用（例如推荐系统）的基本问题之一。但是，GNN不能免疫对抗攻击，即精心制作的恶意例子，旨在欺骗预测模型。在这项工作中，我们专注于对基于GNN的链接预测模型进行特定的白盒攻击，其中恶意节点的目的是出现在给定目标受害者的推荐节点列表中。为了实现这一目标，攻击者节点还可以指望它直接控制的其他现有同伴的合作，即在网络中注入许多``vicious''节点的能力。具体而言，所有这些恶意节点都可以添加新的边缘或删除现有的节点，从而扰乱原始图。因此，我们提出了野蛮人，一种新颖的框架和一种安装这种链接预测攻击的方法。野蛮人将对手的目标制定为一项优化任务，从而达到了攻击的有效性与所需的恶意资源的稀疏之间的平衡。在现实世界和合成数据集上进行的广泛实验表明，通过野蛮人实施的对抗性攻击确实达到了很高的攻击成功率，但使用少量恶性节点。最后，尽管这些攻击需要完全了解目标模型，但我们表明它们可以成功地转移到其他黑框方法以进行链接预测。

translated by 谷歌翻译

Fine-tuning or top-tuning? Transfer learning with pretrained features and fast kernel methods

Paolo Didier Alfano , Vito Paolo Pastore , Lorenzo Rosasco , Francesca Odone

分类：机器学习

2022-09-16

深度学习体系结构的令人印象深刻的性能与模型复杂性的大量增加有关。需要对数百万个参数进行调整，并相应地进行训练和推理时间扩展。但是需要进行大规模的微调吗？在本文中，专注于图像分类，我们考虑了一种简单的转移学习方法利用预卷积特征作为快速内核方法的输入。我们将这种方法称为最佳调整，因为只有内核分类器经过培训。通过执行2500多个培训过程，我们表明这种最佳调整方法提供了可比的精度W.R.T.进行微调，训练时间较小在一个和两个数量级之间。这些结果表明，顶级调整为中小型数据集中的微调提供了有用的替代方法，尤其是在训练效率至关重要的情况下。

translated by 谷歌翻译

Efficient Unsupervised Learning for Plankton Images

Paolo Didier Alfano , Marco Rando , Marco Letizia , Francesca Odone , Lorenzo Rosasco , Vito Paolo Pastore

分类：计算机视觉 | 人工智能 | 机器学习

2022-09-14

监测原位浮游生物的种群对于保留水生生态系统至关重要。浮游生物微生物实际上易受较小的环境扰动的影响，可以反映出随之而来的形态学和动力学修饰。如今，高级自动或半自动采集系统的可用性已允许生产越来越多的浮游生物图像数据。由于大量获得的数据和浮游生物的数字，因此，采用机器学习算法来对此类数据进行分类。为了应对这些挑战，我们提出了有效的无监督学习管道，以提供浮游生物微生物的准确分类。我们构建一组图像描述符，利用两步过程。首先，对预先训练的神经网络提取的功能进行了跨自动编码器（VAE）的培训。然后，我们将学习的潜在空间用作聚类的图像描述符。我们将方法与最新的无监督方法进行了比较，其中一组预定义的手工特征用于浮游生物图像的聚类。所提出的管道优于我们分析中包含的所有浮游生物数据集的基准算法，提供了更好的图像嵌入属性。

translated by 谷歌翻译

Deep Neural Networks as Complex Networks

Emanuele La Malfa , Gabriele La Malfa , Claudio Caprioli , Giuseppe Nicosia , Vito Latora

分类：机器学习 | 人工智能

2022-09-12

从物理的角度来看，深度神经网络是其“链接”和“顶点”迭代处理数据并以优选求解任务的图形。我们使用复杂的网络理论（CNT）作为定向的加权图代表深神网络（DNN）：在此框架内，我们引入指标将DNN作为动力学系统，其粒度从重量到包括神经元在内的层延伸到层。CNT区分参数和神经元数量不同的网络，隐藏层和激活的类型以及客观任务。我们进一步表明，我们的指标会区分低性能网络。CNT是一种理论DNN的综合方法，也是解释模型行为的互补方法，该方法实际上是基于网络理论的，并且超越了研究良好的输入输出关系。

translated by 谷歌翻译